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Abstract-To support government activities, a fast and precise network connection is needed. So it reguires a wide network 
bandwidth. Bandwidth management needs to be done so that the network speed remains stable. This study aims to look at the 
pattern of bandwidth usage in the Regional Government of Padang Pariaman Regency using K-Means Clustering. The data is taken 
from the Cacti application, an open-soutce, web-based network monitoring software. The total extracted datasets used are 32 OPD 
data (Regional Apparatus Organizations) in the Regional Government of Padang Pariaman Regency in 2022. The available data is 
then processed to obtain cluster targets by utilizing the data mining concept using the K-Mean Clustering method. Bandwidth 
usage data grouping in Padang Pariaman Regency uses the Clustering method with the K-Means algorithm with the attributes 
Name OPD, Inbound Average, Inbound Maximum, Outbound Average, Outbound Maximum used in the process of calculating 
and dividing data into 3 clusters with high bandwidth usage categories, low, and medium. Calculations are done manually and then 
tested with RapidMiner software. The results of the manual calculations obtained the same numbet of cluster members as the 
calculations with the RapidMiner software. 


Keywords: Breadth First Search, Certainty Factor, Coffee, Expert System. 


Abstrak-Untuk menunjang kegiatan di Pemerintahan dibutuhkan koneksi jaringan yang yang cepat dan tepat. Sehingga memerlukan 
jaringan bandwith yang lebar. Manajemen Bandwidth perlu dilakukan agar kecepatan jaringan tetap stabil. Penelitian ini bertujuan 
untuk melihat pola penggunaan bandwidth di Pemerintah Daerah Kabupaten Padang Pariaman menggunakan K-Means Clustering. 
Data diambil dari aplikasi Cacti sebuah software open-source, pemantauan jaringan berbasis web. Total datasets hasil ekstraksi yang 
digunakan adalah sebanyak 32 data OPD (Organisasi Perangkat Daerah) yang ada di Pemerintah Daerah Kabupaten Padang 
Pariaman tahun 2022.. Data-data yang tersedia selanjutnya diolah untuk mendapatkan target cluster dengan memanfaatkan konsep 
data mining menggunakan metode K-Mean Clustering. Pengelompokan data pengunaan bandwidth di Kabupaten Padang Pariaman 
menggunakan metode Clustering dengan algoritma K-Means dengan atribut Nama OPD, Inbound Average, Inbound Maksimum, 
Outbound Average, Outbound Maximum yang digunakan dalam proses perhitungan dan pembagian data ke dalam 3 cluster dengan 
kategori penggunaan bandwidth tinggi, rendah, dan sedang. Perhitungan dilakukan secara manual dan kemudian dilakukan 
pengujian dengan software RapidMiner. Hasil dari perhitungan manual diperoleh jumlah anggota cluster yang sama dengan 
perhitungan dengan software RapidMiner. 


Kata Kunci: K-Means Algorithm, Clustering, Bandwidth Usage, Data Mining 


1. Pendahuluan 


Manajemen bandwidth sangat diperlukan agar tidak 
terjadi pemborosan penggunaan bandwidth, tersedia 
konektivitas yang stabil, dan membantu administrator 
jaringan untuk mengontrol penggunaan bandwidth. 
Walaupun, sistem administrasi jaringan ' mampu 
mendapatkan data penggunaan menggunakan bandwidth 
dengan menggunakan aplikasi Cacti. Namun, aplikasi 
tersebut belum dapat digunakan dalam menganalisis 
penggunaan bandwidth dengan tepat. Karena itu 
diperlukan metode manajemen bandwidth analisis data. 
Manajemen bandwith penting untuk dilakukan agar dapat 


mengatur bandwidth secara merata kepada seluruh 
pengguna (1|. 

Knowledge Discovery Database (KDD) adalah 
penerapan metode saintifik pada data mining. Penemuan 
Knowledge Discovery Database (KDD) muncul dan 
menjadi hotspot penelitian di bidang kecerdasan buatan 
dan aplikasi database dalam beberapa tahun terakhir. Saat 
ini, penelitian KDD mencakup berbagai macam metode 
penemuan pengetahuan di banyak bidang dan telah 
mampu menemukan berbagai jenis pengetahuan seperti 
aturan deret waktu, aturan asosiasi, aturan klasifikasi, dan 
aturan clustering. Penemuan pengetahuan dalam basis 
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data (KDD) adalah proses penentuan informasi dan pola 
yang berguna dalam data (2). 

Pendekatan — K-means, salah satu metode 
pengelompokan yang paling banyak digunakan, untuk 
mendapatkan kluster ini (3). Kualitas segmentasi dan 
efisiensi algoritma bergantung pada pemilihan centroid 
awal, jumlah cluster yang dipilih, dan tingkat iterasi yang 
akan dilakukan|4|. Algoritma K-means clustering lebih 
efektif dan efisien dalam mengolah data dengan jumlah 
yang banyak (5). K-Means adalah suatu metode yang 
digunakan untuk membagi suatu data kedalam beberapa 
kelompok atau cluster |6|. Clustering (berbasis centroid) 
adalah algoritma clustering yang menggunakan titik 
centroid dalam melakukan pengelompokan objek |7|. K- 
means merupakan algoritma sederhana dengan waktu 
proses yang cepat dan menghasilkan cluster yang optima 
(8I- K-Means adalah algoritma iteratif, itu terus 
mengulangi langkah-langkah di atas sampai tidak ada 
perubahan lokasi centroid (9|, Tujuan dari metode 
clustering data ini adalah untuk meminimalkan fungsi 
tujuan yang ditetapkan dalam proses clustering (10). 
Algoritma K-means memberikan metode sederhana 
untuk mengeksekusi solusi perkiraan|11|. Ini adalah 
pengelompokan eksklusif dan salah satu algoritma yang 
paling banyak digunakan untuk pengelompokan (12). 
Algoritma ini sudah banyak digunakan pada penelitian 
sebelumnya|13). kelebihan algoritma K-Means yaitu 
mampu mengelompokan objek dalam jumlah besar 
dengan pengelompokan yang cepat, dan kekurangan dari 
algoritma K-Means yaitu hasil pengelompokannya yang 
mudah berubah-ubah.|14). Kekuatan algoritma K-means 
adalah karena efisiensi komputasi dan sifat kemudahan 
yang dapatdigunakan (15). Salah satu algoritma untuk 
analisis cluster adalah K-Means clustering (16). Namun, 
K-means mempunyai kelemahan yang diakibatkan oleh 
penentuan pusat awal cluster. Hal ini menyebabkan hasil 
cluster-nya berupa solusi yang sifatnya local optimal. (17). 
Algoritma  k-Means clustering digunakan untuk 
mengelompokkan (18) atau mempartisi sejumlah data n 
menjadi sebanyak k cluster yang mana tiap data tersebut 
masuk ke suatu cluster dengan rerata terdekat. K-Means 
yang merupakan algoritma pengelompokkan iterative 
yang sederhana diimplementasikan|19| 

Penelitian terdahulu yang berkaitan dengan Algoritma 
K-Means Clustering telah banyak dilakukan, seperti pada 
penelitian yang dilakukan oleh Andi Widya Mufila 
Gaffaradan yang membahas mengenai Pengklasifikasian 
Kecepatan Transfer Data Pada Jaringan Backbone 
Menggunakan K-Means|20). Hasil penelitian terdapat tiga 
cluster yaitu kecepatan transfer yang rendah, normal dan 
kecepatan transfer yang tinggi. Penelitian terkait lainnya 
dilakukan oleh Sasa Ani Arnomo dan Yulia, yang 
menerapkan K-Means Clustering mengenai 
pengelompokan potensi peningkatan bandwidth FTTH 
pelanggan pita lebar. Tujuan penelitian ini yaitu 
menentukan pelanggan yang berpotensi untuk dilakukan 
penambahan bandwidth. Penelitian lainnya adalah 
penelitian yang dilakukan mengenai analisis data lalu lintas 
jaringan di kantor Cangehgar Cyber Operation Center 
menggunakan algoritma K-Means (21). Penelitian 


bertujuan untuk menganalisa lalu lintas jaringan di Kantor 
Cangehgar Cyber Operation Center. 


2. Metodologi 


Adapun tahapan penelitian yang dilakukan dapat dilihat 
pada Gambar 1 


Mengidentifikasi Malasah 
Menganalisa Masalah 
Menentukan Tujuan 


MenentukanStudi 
Literatut 
Mengumpulkan Data 


Menganalisa dan Melakukan Data 
Processing 


Mengimplemntasi K-Means 
Menguji Hasil 


Gambar 1. Tahapan Penelitian 


A. Pengumpulan Data 

Data yang digunakan dalam penelitian adalah 
penggunaan bandwidth di beberapa dinas di Kabupaten 
Padang Pariaman. Data yang digunakan sebanyak 32 
sampel data bandwidth dari total sebanyak 55 data . Data 
diambil dengan cara meminta kepada Admin Jaringan dan 
mewawancarai admin jaringan mengenai alokasi 
penggunaan bandwidth, sehingga penulis dapat 
mendapatkan informasi beserta data untuk perhitungan 
menggunakan metoda K-Means. Data meliputi 4 kriteria 
sebagai berikut : 

1. Inbound Average tahun 2022. 

2. Inbound Maksimum tahun 2022. 

3. Outbound Average tahun 2022 

4, Outbound Maximum tahun 2022 
B. Perhitungan dengan K-Means Clustering 
Pada tahap ini akan dilakukan pengolahan data Bandwidth 
menggunakan metode K-Means Clustering hingga 
didapatkan hasil klaster untuk setiap bandwidth. Berikut 
langkah — langkah penyelesainnya 
1. Pilih secara acak k buah data sebagai pusat cluster 
2. Jarak antara data dan pusat duster dihitung 
menggunakan Huclidian distance untuk menghitung jarak 
semua data ke setiap titik pusat duster dapat menggunakan 
teori jarak Buclidean yang dirumuskan pada Persamaan 


W 
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dist (x,y) — 


W) 


3. Data ditempatkan dalam c/uster yang terdekat, dihitung 
dari tengah cluster 

4. Pusat cluster baru akan ditentukan bila semua data 
telah ditetapkan dalam cluster terdekat 

5. Proses penentuan pusat cluster dan penempatan data 
dalam c/uster diulangi sampai nilai centroid tidak berubah 
lagi. 

Data yang diperoleh peneliti menggunakan 4 atribut. 
Berikut adalah data yang digunakan yaitu data pemakaian 
Bandwidth di Pemerintah Daerah Kabupaten Padang 
Pariaman tahun 2022. 


Tabel 1 Data Penggunaan Bandwidth 


OPD Inbo Inbou Outb Outb 
und nd ound ound 
Aver Maksi Avera Maxi 
age  mum ge mum 
Setwan 4.26 914 0.343 1.46 
Inspektorat 1.59 437 0178 1.28 
Disdikbud 2.82 8.57 0.215 1.2 
Dinkes 4.67 10.69 0.546 3.24 
DinsoP3A 3:32 5.97 0281 0.939 
DLHKP 2.61 71.63 0.227 1.89 
DPMD 3.48 8.66 0.35 1.61 
DPPKB 24 1.36 0.222 1.81 
Disnagnakerko 412 10.35 0.532 3.22 
Pp 
DPMPTP 2.06 7.01 0.202 0.992 
Dinas 2.28 116 0.325 1.67 
Pariwisata 
Dinas Kearsipan 1.48 8.24 0166 0.844 
Dinas Pertanian 2.53 6.91 0.329 214 
Dinas 2.71 6.3 0.236 1.33 
Peternakan 
Dinas PUPR 4.23 12.3 0.433 1.66 
Dinas 1.63 514 0156 1.15 
Perikanan 
Disdukcapil 5.74 11.63 0.704 471 
BPBD 711 12.62 0.64 2.94 
Bappeda- 5.89 151 0.552 41 
BKPSDM 
Kec. Batang 2.84 8.59 0.216 2.09 
Anai 
Kec. Nan 1.42 3.19 0.82 0.162 
Sabaris 


Kec. 2X11 2.52 6.89 0.185 0.65 
Kayutanam 

Kec. V Koto 2.15 5.33 0.209 0.171 
Kampung 

Dalam 

Kec. Ulakan 2.86 619 0.203 1.03 
Tapakis 

Kec. Sintoga 1.29 37 0112 0.829 
Kec. Padang 3.65 3.65 0.26 0.26 
Sago 

Batang Gasan 1.39 413 0.127 1.27 
Kec. V Koto 2.27 5.09 0.185 1.02 
Timur 

Kec 2x11 Enam 1.04 2.74 01 0.287 
Lingkung 

Kec Patamuan 2.33 4.67 0.482 1.63 
Kec. Enam 25 4.85 0.189 0.951 
Lingung 

Kec IV Koto Aur 0.82 314 0.061 0.354 
Malintang 3 


Proses perhitungan yang peneliti adalah menggunakan 
Murosoft Excel dengan langkah — langkah berikut: 


1. Menentukan jumlah cluster 

Jumlah cluster merupakan jumlah kelompok yang akan 
dihasilkan. Jumlah ini menyesuaikan dengan kebutuhan 
analisis dalam penelitian ini jumlah cluster yang akan 
digunakan sebanyak 3 duster. 

2. Menentukan Centroid Awal 
Proses awal dustering algoritma k-means adalah 
menentukan titik pusat awal cluster (centroid). Centroid awal 
ditentukan secara acak seperti tabel 2 dibawah 


Tabel 2 Centroid Awa 
Inboun Inbound  Outboun  Outboun 
d Maksimu d d 
Average m Average — Maximu 
m 
Cc 2.4 7.36 0.222 1.81 
1 
€C 2.53 6.91 0.329 214 
2 
Cc 5.89 151 0.552 41 
3 


3. Menghitung Jarak Data ke Titik Pusat Cluster 
Langkah selanjutnya adalah menghitung jarak setiap data 
dengan centroid awal menggunakan persamaan Euclidean 
Distance. Pada tahap ini, jarak terdekat antara data dan 
cluster akan menentukan data mana yang termasuk dalam 
kelompok data mana. Berikut adalah hasil perhitungan 
jarak pada iterasi ke-1. 
Tabel 3 Hasil Iterasi ke-1 
OPD Jarak ke Centroid  Kelom 
pok 
C1 C2 C3 
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Setwan 
Inspektorat 
Disdikbud 
Dinkes 
DinsoP3A 
DLHKP 

DPMD 

DPPKB 
DISDAGNAKER 
DPMPTIP 

Dinas Pariwisata 
Dinas Kearsipan 
Dinas Pertanian 
Dinas Peternakan 
Dinas PUPR 
Dinas Perikanan 
Disdukcapil 
BPBD 
Bappeda-BKPSDM 
Kec. Batang Anai 


Kec. Nan Sabaris 


Kec. 2X11 
Kayutanam 

Kec. v Koto 
Kampung Dalam 
Kec. Ulakan 
Tapakis 


Kec. Sintoga 

Kec. Padang Sago 
Batang Gasan 

Kec. V Koto Timur 
Kec 2x11 Enam 
Lingkung 


Kec Patamuan 


2.6 
01 
3.1 
43 
14 
19 
4.2 
89 
1.8 
82 
0.3 
51 
1.7 
07 
0.0 
00 
37 
39 
0.9 
53 
0.4 
52 
1.5 
99 
0.5 
83 
12 
04 
5.2 
74 
24 
42 
6.1 
95 
74 
63 
8.8 
00 
1.3 
36 
4.6 
28 
12 
58 
2.6 
21 
14 
80 
3.9 
50 
4.2 
11 
3.4 
28 
24 
07 
5.0 
53 
21 
09 


2.9 
03 
2.8 
46 
1.9 
33 
44 
86 
1.7 
18 
0.7 
73 
2.0 
61 
0.5 
83 
3.9 
46 
12 
51 
1.0 
03 
21 
40 
0.0 
00 
1.0 
34 
5.6 
73 
2.2 
26 
6.2 
96 
7.3 
70 
9.0 
70 
1.7 
13 
4.3 
85 
14 
OT 
2.5 
56 
19 
69 
3.6 
89 
3.9 
27 
3.1 
35 
21 
58 
4.8 
06 
2.3 
11 


C2 


2.6 23 112 C2 
Kec. Enam Lingung 55 83 52 
Kc IV Koto Aur 47 45 13.5 C2 
Malintang 37.15 21 


4. Menghitung Titik Pusat Centroid Baru 

Pada iterasi pertama data telah menghasilkan keanggotaan 
cluster, selanjutnya penulis melakukan perhitungan untuk 
menentukan nilai titik pusat duster baru yang diperoleh 
dari menghitung rata-rata keanggotaan dari cluster 1, cluster 
2 dan cluster 3, berikut merupakan nilai centroid baru: 


Tabel 4 Titik Pusat Custer Iterasi ke-2 


Inbo Inbound  Outboun  Outboun 


und  Maksimu d d 
Aver m Average — Maximu 
age m 
C1 2.962 8.408 0.294 1.723 
C2 2.094 4.711 0.246 0.925 


C3 5.743 12.913 0.582 3.368 


Langkah selanjutnya adalah menghitung jarak setiap data 
dengan centroid baru menggunakan persamaan Euclidean 
Distance. Pada tahap ini, jarak terdekat antara data dan 
cluster akan menentukan data mana yang termasuk dalam 
kelompok data mana. Berikut adalah hasil perhitungan 
jarak pada iterasi ke-2. 


Tabel 5 Hasil Iterasi ke-2 


OPD Jarak ke Centroid Kelo 


C1 C2 C3 k 


Setwan 1.514 4.960 4.486 C1 
52551 51613 12965 
5 3 8 

Inspektorat 4288 0.707 9.733 C2 
65946 40833 37746 
8 7 2 

Disdikbud 0.571 3.936 5.677 C1 
19074 80000 25649 
6 8 5 

Dinkes 3.239 69016 2.471 C3 
28387 47891 30184 
7 3 6 

DinsoP3A 2.585 1758 7.749 C2 
46634 04029 52749 

1 5 

DLHKP 0.872 3117 6.326 C1 
10370 73576 65561 
3 6 8 

DPMD 0.590 4242 5.132 C1 
18757 471811 77168 
5 5 
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DPPKB 
DISDAGNAK 
ER 

DPMPTP 
Dinas 
Pariwisata 


Dinas 
Kearsipan 


Dinas 
Pertanian 


Dinas 
Peternakan 


Dinas PUPR 
Dinas 
Perikanan 


Disdukcapil 


BPBD 


Bappeda- 
BKPSDM 


Kec. 
Anai 


Batang 


Kec. 
Sabaris 


Nan 


Kec. 2X11 
Kayutanam 


Kec. V Koto 
Kampung 
Dalam 

Kec. Ulakan 
Tapakis 


Kec. Sintoga 


Kec. 
Sago 


Padang 


Batang Gasan 


C2 


C3 


C2 


C3 


C3 


C3 


C1 


C2 


C1 


C2 


C2 


C2 


C2 


C2 


Kec. V Koto 3462 0.433 8.883 C2 
Timur 70374 09705 59872 
1 5 

Kec2x11Enam 6157 2.328 11.63 C2 
Lingkung 36334 64782 25108 
5 2 1 

Kec Patamuan 3.796 0.781 9.089 C2 
29697 06901 16491 
2 4 3 

Kec. Enam 3.670 0.433 9.028 C2 
Lingung 96293 78644 39023 
5 5 9 

KcIV KotoAur 5.852 2107 11.36 C2 
Malintang 25941 70975 02869 
9 8 


5. Menghitung Titik Pusat Centroid Baru (Iterasi 3) 
Pada iterasi pertama data telah menghasilkan keanggotaan 
cluster, selanjutnya penulis melakukan perhitungan untuk 
menentukan nilai titik pusat duster baru yang diperoleh 
dari menghitung rata-rata keanggotaan dari cluster 1, cluster 
1, dan cluster 3, berikut merupakan nilai centroid baru: 


Tabel 6 Titik Pusat C/uster Iterasi ke-3 


Inbou  Inbound Outbou Outboun 
nd Maksimu nd d 
Avera m Average  Maximu 
ge m 
C1” 783 8.093 0.276 1.631 
C2 965 4.564 0.240 0.844 
C3 559 12.468 0.575 3.342 


Langkah selanjutnya adalah menghitung jarak setiap data 
dengan centroid baru menggunakan persamaan 
Euclidean Distance. Pada tahap ini, jarak terdekat antara 
data dan cluster akan menentukan data mana yang 
termasuk dalam kelompok data mana. Berikut adalah 
hasil perhitungan jarak pada iterasi ke-2. 


Tabel 7 Hasil Iterasi ke-3 


OPD Jarak ke Centroid Kelo 
mpo 
C1 C2 C3 k 
Setwan 1819 5113 4.034 C1 
79251 53290 74361 
7 1 
Inspektorat 3.926 0.675 9.246 C2 
07817 93766 34527 
1 6 8 
Disdikbud 0.647 4.092 5.219 C1 
39488 12385 71570 
6 7 1 
Dinkes 3.601 7.081 1.977 C3 
00344 53444 04147 
4 7 7 
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DinsoP3A 
DLHKP 
DPMD 
DPPKB 
DISDAGNAK 
ER 

DPMPTP 
Dinas 


Pariwisata 


Dinas 
Kearsipan 


Dinas 
Pertanian 


Dinas 
Peternakan 


Dinas PUPR 
Dinas 
Perikanan 


Disdukcapil 


BPBD 


Bappeda- 
BKPSDM 


Kec. 
Anai 


Batang 


Kec. 
Sabaris 


Nan 


Kec. 2X11 
Kayutanam 


Kec. V Koto 
Kampung 
Dalam 

Kec. Ulakan 
Tapakis 


2.296 
16371 
5 
0.559 
69647 


0.901 
84910 
4 
0.847 
54850 
7 
3.077 
72347 
8 
1.452 
32244 
1 
0.606 
46253 
4 
1.533 
76263 


1.313 
02505 
9 
1.819 
57022 
6 
4.452 
11988 
5 
3.208 
35094 
8 
5.593 
76407 


6.408 
07343 
4 
8.057 
72456 
3 
0.681 
68355 
g 
5.324 
28966 
8 
1.576 
91052 
6 
3.188 
97786 
2 
1.998 
07777 
8 


1.887 
55640 
9 
3.285 
02530 
6 
4.402 
08844 
3 
2.977 
08273 
2 
6.590 
22743 
1 
2.450 
75977 
2 
3.309 
06033 
9 
3.722 
97074 
9 
2.721 
59797 
3 
1.914 
65666 
1 
8.076 
89932 
6 
0.788 
31685 
4 
8.891 
69413 
2 
9.741 
91651 
2 
11.67 
63247 
8 
4.285 
10188 
1 
1.762 
21216 
8 
2.378 
68738 
2 
1.023 
79626 
7 
1.819 
88975 
7 


C2 


C3 


C2 


C3 


C3 


C3 


C1 


C2 


C1 


C2 


C2 


Kec. Sintoga 4711 1167 10.06 C2 
12889 69530 81679 
6 1 6 

Kec. Padang 4.729 1.920 9.533 C2 
Sago 45329 86855 20287 
5 2 2 

Batang Gasan 4218 00915 9.546 C2 
41683 34725 68403 
5 4 2 

Kec. V Koto 3.108 0.593 8.401 C2 
Timur 13880 86782 97786 
1 FA 2 

Kec2x11Enam 5.790 2169 11.15 C2 
Lingkung 22240 64994 05505 
3 1 

Kec Patamuan 3.458 0.870 8.600 C2 
53366 40771 90698 
9 8 7 

Kec. Enam 3.326 0.533 8.548 C2 
Lingung 33529 98264 01643 
2 2 7 

KcIV KotoAur 5.481 1.960 10.87 C2 
Malintang 60272. 18417 84626 
8 4 2 


6. Menghitung Titik Pusat Centroid Baru (Iterasi 4) 
Pada iterasi pertama data telah menghasilkan keanggotaan 
cluster, selanjutnya penulis melakukan perhitungan untuk 
menentukan nilai titik pusat cluster baru yang diperoleh 
dari menghitung rata-rata keanggotaan dari cluster 1, 
cluster 2, cluster 3 dan cluster 3, berikut merupakan nilai 
centroid baru: 


Tabel 8 Titik Pusat Custer Iterasi ke-4 


Inbou Inbound Outboun  Outbou 
nd Maksim d Average nd 
Avera um Maxim 
ge um 
C1 2.666 7.155 0.251 1.474 
C2 2.019 4.440 0.240 0.810 
C3 5.293 12.115 0.568 3.322 


Langkah selanjutnya adalah menghitung jarak setiap data 
dengan centroid baru menggunakan persamaan 
Euclidean Distance. Pada tahap ini, jarak terdekat antara 
data dan cluster akan menentukan data mana yang 
termasuk dalam kelompok data mana. Berikut adalah 
hasil perhitungan jarak pada iterasi ke-2. 


Tabel 9 Hasil Iterasi ke-4 


OPD Jarak ke Centroid Kelo 
mpo 
C1 C2 C3 k 
Setwan 2113 5.248 3.665 C1 
80853 50041 34522 
7 
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Inspektorat 


Disdikbud 


Dinkes 


DinsoP3A 


DLHKP 


DPMD 


DPPKB 


DISDAGNAK 


ER 


DPMPTP 


Dinas 


Pariwisata 


Dinas 
Kearsipan 


Dinas 
Pertanian 


Dinas 
Peternakan 


Dinas PUPR 
Dinas 
Perikanan 


Disdukcapil 
BPBD 
Bappeda- 


BKPSDM 


Kec. Batang 
Anai 


Kec. Nan 
Sabaris 


C2 


C1 


C3 


C3 


C3 


C2 


C3 


C3 


C3 


C1 


C2 


Kec. 2X1 1.205 2.506 6.502 C1 
Kayutanam 23600 43265 02790 

7 8 
Kec. V Koto 2.801 1103 8.122 C2 
Kampung 04905 61849 32917 
Dalam 9 6 
Kec. Ulakan 1.638 1.954 6.812 C1 
Tapakis 97828 51953 60417 

9 9 


Kec. Sintoga 4332 1.046 9.657 C2 
57038 68417 12555 


8 9 1 
Kec. Padang 4.392 1.894 9155 C2 
Sago 38835 01736 61759 

9 3 7 


Batang Gasan 3.850 0.846 9.132 C2 
37433 37414 354091 


2 8 3 
Kec. V Koto 2.732 0.730 7.995 C2 
Timur 99722 04622 96149 

5 1 6 
Kec2x11Enam 5406 2.034 10.74 C2 
Lingkung 01832 86799 28831 

8 8 9 


Kec Patamuan 3115 0.938 8.190 C2 
70283 84765 14486 


7 2 5 
Kec. Enam 2.956 0.649 8.145 C2 
Lingung 98593 85563 33677 

7 2 9 
KcIV KotoAur 5.097 1.832 10.46 C2 
Malintang 50067 89429 89269 

8 2 1 


7. Menghitung Titik Pusat Centroid Baru (Iterasi 5) 
Pada iterasi pertama data telah menghasilkan keanggotaan 
cluster, selanjutnya penulis melakukan perhitungan untuk 
menentukan nilai titik pusat cluster baru yang diperoleh 
dari menghitung rata-rata keanggotaan dari cluster 1, 
cluster 2, dan cluster 3, berikut merupakan nilai centroid 
baru: 


Tabel 10 Titik Pusat Custer Iterasi ke-5 


Inbou Inbound Outboun  Outbou 
nd Maksim d Average nd 


Avera um Maxim 

ge um 
C1 2.126 7.516 0.250 1.404 
C2 1.840 4167 0.240 0.780 


C3 5:293 12.115 0.568 3.322 


Proses penghitungan nilai centroid baru telah dilakukan, 
langkah selanjutnya adalah menghitung ulang data dengan 
nilai centroid baru. Dalam studi kasus ini, penulis 
melakukan perhitungan hingga iterasi ke-5. Pada iterasi 4 
dan 5 data tidak merubah keanggotaan cluster. 
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Tabel 11 Hasil Iterasi ke-5 


OPD 


Setwan 


Inspektorat 


Disdikbud 


Dinkes 


DinsoP3A 


DLHKP 


DPMD 


DPPKB 


DISDAGNAK 
ER 

DPMPTP 
Dinas 


Pariwisata 


Dinas 
Kearsipan 


Dinas 
Pertanian 


Dinas 
Peternakan 


Dinas PUPR 
Dinas 
Perikanan 


Disdukcapil 


BPBD 


Jarak ke Centroid 


C1 


C2 


C3 


C2 


C1 


C3 


C3 


C2 


C3 


C3 


Bappeda- 8.653 1212 3.142 C3 
BKPSDM 87653 66580 01998 

8 6 5 
Kec. Batang 1.280 4.720 4.481 C1 
Anai 17118 29412 65805 

8 5 4 
Kec. Nan 4.720 1.359 10.23 C2 
Sabaris 18873 89728 25665 

4 5 2 
Kec. 2X1 1.003 2.810 6.502 C1 
Kayutanam 37650 44607 02790 

6 2 8 
Kec. V Koto 2.575 1.349 8.122 C2 
Kampung 15255 64160 32917 
Dalam 8 4 6 
Kec. Ulakan 1.384 2.279 6.812 C1 
Tapakis 69898 79475 60417 

2 5 


Kec. Sintoga 4119 0.734 9.657 C2 


3 7 1 

Kec. Padang 4135 1.952 9.155 C2 
Sago 86795 76461 61759 
1 7 


Batang Gasan 3.644 0.675 9.132 C2 


7 9 3 
Kec. V Koto 2.498 1.047 7.995 C2 
Timur 80831 70485 96149 

3 3 6 
Kec2x11Enam 5188 1.714 10.74 C2 
Lingkung 59496 27310 28831 

4 9 9 
Kec Patamuan 2.891 1128 8190 C2 


8 4 5 
Kec. Enam 2.714 0.966 8.145 C2 
Lingung 06850 40267 33677 
4 2 9 
KcIV KotoAur 4.889 1.517 10.46 C2 
Malintang 57941 43642 89269 
4 1 1 
8. Implementasi Algoritma K-Means 


Menggunakan RapidMiner 
Penerapan Algoritma K-Means menggunakan 
RapidMiner bertujuan untuk mengelompokkan data 
penggunaan bandwidth, untuk memulai pilih operator K- 
Menas 


Vo1.14 no.1 |Juni 2023 
EXPLORE : ISSN: 2087-2062, Online ISSN: 2686-181X / DOI: http://dx.doi.otrg/10.36448 /jsit.v14i1.3037 


This work is licensed under a Creative Commons Attribution 4.0 International License 


Operators 
k-me x 


“ 88 Modeling (6) 

“ 83 Segmentation (6) 
BB k-Means 
(BB k-Means (H2O) 
BI k-Means (Kernel) 
(BB k-Means (fast) 
BB k-Medoids 
@ Cluster Model Visualizer 

Gambar 2. Memilih Metode K-Means. 


Sebelum menerapkan algoritma k-Means maka data 
dengan format “.xls di import terlebih dahulu ke dalam 
RapidMiner dengan klik “Add Data”. Selanjutnya pilih 
lokasi penyimpanan dataset yang akan digunakan. Karena 
dataset penulis berbentuk file yang memiliki format “.xls 
dan bukan berasal dari database seperti sgl maka pilih 
lokasi dari “My Computer”. 


Where is your data? 


ma comouee 


Home 


Gambar 3. Import Data 


Selanjutnya pilih data import ke dalam RapidMiner. 
Apabila data yang dipilih telah terindikasi tidak ada 
masalah maka akan muncul “no problems” pada proses 
import data. Lalu lanjutkan hingga finish, sehingga data 
berhasil di import ke dalam RapidMiner. 


9. Membuat Lembar Proses 

Setelah data diimpor, data dimasukkan ke halaman 
Proses. Dengan menyeret data yang diimpor. Contoh file 
data dalam penelitian yang digunakan disini adalah data 
bandwidth 2022. Kemudian drag dan drop bandwidth 
2022 ke halaman proses. Gambar 4 di bawah ini 
merupakan implementasi dari RapidMiner. 


File Edit Process View Connections Settings Extensions Help 


Alaik - bb - - iews Design Resuit 
Repository Process 
@ import Data 3- (@& Process 


BI Penghitungan K-Means 4 55 Dal “ 
IM Penghitungan K-Means 4 Kriteri: 
MI Penghitungan K-Means 4 Label | inp 
“ef proses 32 Data senassssru 


2 ““Retrieve databandwith”—— 7 
(BS Perhitungan K-Menans Tesis c 


HH data bandwith (24425 10-40AM- A 


processes 


» Mitest 
BN Aa ananna - v 
« li » 
Operators 
K-mea x 


7 8S Modeling (6) 
ES Segmentation (6) 
BB k-Means 
BB k-Means (H20) 
BEI -Moane (Kernel 


Gambar 4. Lembar Proses 
10. Menerapkan Algoritma K-Means 


Langkah selanjutnya adalah memasukkan Algoritma k- 
Means pada proses yang telah terbentuk diatas untuk 
mengetahui pengelompokkan dari proses yang telah 
dibuat. Cari “K-Means” pada Operator lalu tarik ke 
sebelah“data” lalu hubungkan ke “Clustering” dan “res”. 
Gambar 5 dibawah ini merupakan implementasi pada 
Rapid Miner. 


oP Nasri 


T emiove untaseled 
A 


| eteemune go0g Hartaves 


D Henagamas.carametna 
ubi ena 110.001 


Wotp 


- k-Means 


Gambar 5. Proses K-Means 


Masukan nilai k yang diinginkan, disini peneliti 
memasukan nilai 3 karena pada kasus ini peneliti 
mengelompokkannya menjadi 3 d/uster. Setelah itu lakukan 
running pada proses untuk mendapatkan hasil clustering dari 
Algoritma K-Means yang diterapkan pada RapidMiner. 
Hasil Custering dari Algoritma k-Means dapat dilihat pada 
gambar 6. 
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Row No, id cluster Parameter B (3 D 

1 4 cluster 0 4.260 9.140 0.343 1.460 
2 2 cluster 1 1.590 4.370 0.178 1.280 
3 3 cluster 0 2820 8.570 0.215 1.200 
4 4 cluster 2 4.670 10.690 0.546 3.240 
5 5 cluster 0 3.320 5.970 0.281 0.939 
6 6 cluster 0 2.610 7.630 0.227 1.890 
7 7 cluster 0 3.480 8.660 0.350 1.610 
8 8 cluster 0 2.400 7.360 0.222 1.810 
9 9 cluster 2 4.120 10.350 0.532 3.220 
10 10 cluster 0 2.060 7.010 0.202 0.992 
“ 1 cluster 0 2280 7.760 0.325 1.670 
12 12 duster 0 1.480 8.240 0.186 0.844 
13 13 cluster 0 2530 6.910 0.329 2140 
14 14 cluster 0 2710 6.300 0.236 1.330 
15 15 cluster 2 4.230 12.300 0.433 1.660 


ExampleSet (32 examples, 2 special attributes, 4 regular attributes) 
Gambar 6. Hasil Clustering 


Proses run akan berjalan dengan baik jika muncul 
tampilan data pada tampilan Data View yang berhasil 
dijalankan seperti gambar diatas. Pada bagian visualisasi, 
kita dapat melihat garis dimana ditentukan jumlah 
clustering group di setiap Dinas. Untuk visualisasi di sisi kiri 
untuk sumbu x, sumbu y, dan warna custom pilih (cluster) 
semuanya akan terlihat pada gambar di bawah ini. Dalam 
visualisasi tersebut, kita dapat mengetahui bagian grup 
mana yang mendapatkan posisi dustering pada level 0, 1, 
dan 2. 


Gambar 7. Visualisasi 
3. Kesimpulan 


Berdasarkan penelitian yang telah dilakukan dapat 
disimpulkan bahwa dengan algoritma  K-Means 
Clustering didapatkan pengetahuan baru (knowledge) dari 
penggunaan bandwidth di Pemerintah Kabupaten 
Padang Pariaman sehingga pihak Admin Jaringan di 
Dinas Komunikasi dan Informatika Kabupaten Padang 
Pariaman dapat mengoptimalkan pembagian bandwidth 
berdasakan tingkat pemakaian bandwidth setiap OPD 
yang ada di Kabupaten Padang Pariaman. Dari data 
bandwidth selama tahun 2022, penggunaan bandwidth 
telah dikelompokan menjadi 3 kelompok yaitu OPD yang 
memiliki tingkat penggunaan bandwidth tinggi terdapat 
6 OPD, lalu tingkat pemakaian sedang terdapat 14 OPD, 
sedangkan untuk tingkat pemakaian bandwidth rendah 
sebanyak 12 OPD. 
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